課程資訊
課程名稱
研究方法與資料處理
Research Methods and Data Analysis 
開課學期
110-1 
授課對象
社會科學院  社會學系  
授課教師
蘇國賢 
課號
Soc4017 
課程識別碼
305 48900 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期一7,8,9(14:20~17:20) 
上課地點
社科501 
備註
限學士班學生
總人數上限:30人
外系人數限制:6人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

視訊連結:https://meet.google.com/amm-jhnj-cia

本課程為社科院「學士班跨域專長」及社會系榮譽學程的選修課程,也是社會系大學部之量化資料處理的進階課程。延續一、二年級的初級統計及研究方法的課程訓練,本課程將進一步訓練學生運用資料分析來從事科學研究。適合大三、大四以上,有志於從事量化研究的同學選修。課程內容主要包含社會學計量模型的介紹及stata語言的訓練。程式語言的訓練將以STATA的語法為主,本課程前半部訓練同學從資料的整理、除誤、變數測量、資料結構的轉換、及報表的整理等。課程後半部為統計模型的介紹,主要以迴歸模型及簡易的類別資料分析的應用為主。 

課程目標
本課程主要為培訓使用統計計量方法來研究行為科學的能力,為認識科學研究及數據科學的中級課程。為奠定日後同學從事高階量化課程學習的基礎,課程將同時強調數理理論與語言程式的訓練。以培養同學使用調查資料及次級資料進行分析的實作能力。修課同學將學習如何運用資料分析的技術來解決實際及學術問題。本課程適合對於未來想要從事數據科學及人工智慧相關領域的同學、或是有志於從事學術工作的同學,幫助打好資料分析及程式撰寫的基礎,也透過實際資料分析來理解資料科學目前遇到的困難與侷限。 
課程要求
本課程的課程要求,是在期末時獨立完成一篇完整的學術論文報告,包含文獻的回顧、假設的提出、方法的說明、資料分析及對於結果的詮釋。修課同學除了每週參與課程討論之外,也需要定期回報資料分析結果與論文進度,於期中與期末分別進行一次口頭報告。本課程歡迎所有願意接受挑戰的社科院同學,但因為課程內容的吸收,需要對基本統計及分析能力有一定的基礎,且讀本大多以英文為主,因此建議同學「非誠勿試」,以免徒增雙方的困擾。 
預期每週課後學習時數
 
Office Hours
另約時間 備註: 每位同學在期中考之前必須與授課老師個別約談一次,討論研究構想。期中考之後期末考之前再個別約談一次,討論期末報告的內容。 
指定閱讀
John Scott Long. 2009. The workflow of data analysis using Stata. Texas: Stata Press

Mtchell, Michael N. 2021. Interpreting and Visualizing Regression Models Using Stata (2nd ed.). Texas: Stata Press.  
參考書目
Ulrich Kohler and Frauke Kreuter. 2012. Data analysis using stata (3rd ed.)

Christopher F. Baum. 2016. An Introduction to Stata Programming, Second Edition

Long, Scott, and Jeremy Freese. 2014. Regression Models for Categorical Dependent Variables Using Stata, Third Edition. Stata Press.

Michael N. Mitchell. 2020. Data Management Using Stata: A Practical Handbook (2nd ed.). Stata Press 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
期末報告 
60% 
完整的研究報告一篇 
2. 
平時表現 
20% 
上課出席、參與討論、每週作業 
3. 
期中報告 
20% 
論文架構報告(期中考) 
 
課程進度
週次
日期
單元主題
第1週
09/27  課程介紹
視訊連結:https://meet.google.com/amm-jhnj-cia 
第2週
10/04  論文撰寫的流程-文獻整理的方法,論文格式 
第3週
10/11  國慶補假 
第4週
10/18  資料蒐集、研究流程與管理workflow planning, organizing, and documenting 
第5週
10/25  撰寫程式與除錯 :stata基本指令與簡易分析 
第6週
11/1  巨集指令的應用:introduction to programming: macro & loops 
第7週
11/08  變數的命名與標籤 label and notes 
第8週
11/15  資料清理與除誤 data cleaning 
第9週
11/22  資料結構的整理merge, append, and reshape 
第10週
11/29  期中口頭報告 
第11週
12/13  線性迴規模型linear regression 
第11週
12/06  分組描述資料stratifying and subgroups 
第12週
12/20  非線性迴歸與交互作用nonlinearity and interaction 
第13週
12/27  piecewise迴歸模型 
第14週
1/03  類別自變數-虛擬變數的應用, categorical predictors 
第15週
1/10  期末口頭報告與論文due類 
第16週
1/17  類別資料為依變項:線性機率模型及logistic迴歸模型 
第17週
1/24  其他類別資料模型簡介:計數依變項迴歸模型、多類別依變項迴歸模型 
第18週
1/31  放寒假